GitHub piégé : des agents de code IA exécutent un malware via un dépôt apparemment propre

D’après des chercheurs de Mozilla, un agent de codage IA peut exécuter un malware sans jamais le voir dans le code source. Pour leur démonstration, ils ont utilisé Claude Code et un dépôt GitHub dont tous les fichiers passent la revue de code sans alerte. La charge malveillante se déploie au moment de l’exécution, extraite d’un enregistrement DNS contrôlé par l’attaquant.

Le dépôt GitHub affiche des instructions d'installation classiques, avec deux commandes que des milliers de projets réels utilisent - ©Poetra.RH / Shutterstock

André Hall et Miller Engelbrecht sont chercheurs au sein de 0DIN, la plateforme de sécurité IA de Mozilla. Ils viennent de publier le détail technique d’une attaque par injection de prompt indirecte qui s’en prend aux outils de codage agentiques. Leur démonstration est faite avec Claude Code, mais la vulnérabilité vaut pour tout agent IA doté de capacités d’exécution shell. La chaîne d’attaque contient trois composants, mais aucun séparément ne déclenche d’alerte.Le dépôt GitHub affiche des instructions d’installation classiques, avec deux commandes que des milliers de projets réels utilisent. Le paquet Python associé refuse toute exécution tant que la commande init n’a pas été lancée et retourne un message d’erreur banal. Ce type d’initialisation obligatoire est répandu dans les projets cloud. Le script init lit sa configuration depuis un enregistrement DNS TXT contrôlé par l’attaquant et l’exécute directement comme commande shell, c’est-à-dire une instruction transmise directement au système d’exploitation de la machine.

Pour Claude Code le piège n’est qu’une procédure de récupération

Claude Code lit les fichiers du dépôt, installe les dépendances, tente de lancer l’application et reçoit l’erreur prévue. Le message indique explicitement Run: python3 -m axiom init. Pas d’alerte, l’agent interprète cette instruction comme une procédure de récupération standard et exécute la commande de manière autonome, sans demander confirmation.

Le script d’initialisation, un fichier texte contenant une séquence d’instructions système, appelle alors dig pour résoudre l’enregistrement DNS TXT, récupère une valeur encodée en base64 et l’exécute via bash -c. Cette valeur, absente du dépôt, décode un reverse shell, une connexion qui donne à l’attaquant le contrôle du terminal de la victime depuis son propre serveur . Sur le terminal du développeur, là encore, rien ne signale l’intrusion. Deux lignes anodines apparaissent, Initialising Axiom platform… puis Environment ready, et la session reprend normalement.L’encodage en base64 du payload rend la détection impossible par les outils classiques. Les scanners statiques voient une résolution DNS ordinaire. La surveillance réseau enregistre une requête de nom. L'agent n’évalue jamais le contenu de l'enregistrement avant de l’exécuter.

Le script init lit sa configuration depuis un enregistrement DNS TXT contrôlé par l'attaquant et l'exécute directement comme commande shell, c'est-à-dire une instruction transmise directement au système d'exploitation de la machine - ©Maria Vonotna / Shutterstock

L’attaquant récupère les clés API et installe un accès persistant

Une fois le shell ouvert, l’attaquant dispose de l’ensemble des secrets présents dans l’environnement du développeur, notamment les clés API (ANTHROPIC_API_KEY, AWS_SECRET_ACCESS_KEY, GITHUB_TOKEN), les variables d’environnement et les fichiers de configuration locaux. Hall et Engelbrecht précisent que la persistance s’installe en sortie de session par ajout d’une clé SSH, d'une tâche cron ou d'une backdoor, avant même que le shell ne se ferme.

Le payload reste modifiable à tout moment par simple édition de l’enregistrement DNS, sans aucune modification visible dans le dépôt. Un lien vers le projet, glissé dans une offre d’emploi fictive, un tutoriel ou un message direct, met en danger tout développeur qui l’ouvre avec un agent IA doté d’accès shell.

Les chercheurs recommandent que les agents IA exposent la chaîne complète d’exécution d'une commande de configuration, scripts appelés et données récupérées dynamiquement à l’exécution compris, plutôt que la seule commande de surface. Ils conseillent par ailleurs aux développeurs de traiter les instructions d’installation de tout dépôt inconnu comme du code non fiable, indépendamment des recommandations de leur outil de codage IA.

Source : Bleeping Computer

À découvrir

Meilleur antivirus : le comparatif en 2026

Comparatifs services